راه اول: اضافه کردن فایل Robots.txt به وب سایت:
شما می توانید در فایل Robots.txt ، فایل ها و فولدر هایی که تمایل دارید موتور جستجو به آن دسترسی داشته باشد یا فایل ها و فولدرهایی که تمایل دارید موتور جستجو به آن دسترسی نداشته باشد را معرفی کنید.
این فایل، یک فایل متنی ساده است که می تواند محتویاتی همانند زیر داشته باشد:
User-agent: *
این خط فقط به ربات گوگل مجوز اعمال دستورات بعد از این خط را می دهد:
User-agent: googlebot
این خط به ربات جستجوگر اعلام می کند که اجازه ایندکس کردن فایل و فولدرهای مسیر جاری را ندارد:
Disallow: /
این خط به ربات جستجوگر اعلام می کند که اجازه ایندکس کردن فایل با نام login.aspx را ندارد:
Disallow: /login.aspx
این خط به ربات جستجوگر اعلام می کند که اجازه ایندکس کردن محتویات فولدر admin را ندارد:
Disallow: /admin/
راه دوم: اضافه کردن Metatag های noindex و nofollow به صفحه:
این خط به ربات جستجوگر اعلام می کند که اجازه ایندکس کردن صفحه حاوی این metatag را ندارد:<META NAME="robots" CONTENT="noindex">
این خط به ربات جستجوگر اعلام می کند که اجازه ایندکس کردن لینک های موجود در صفحه حاوی این metatag را ندارد:
<META NAME="robots" CONTENT="nofollow">
این خط به ربات جستجوگر اعلام می کند که اجازه ایندکس کردن صفحه حاوی این metatag و همچنین لینک های موجود در صفحه حاوی این metatag را ندارد:
<META NAME="robots" CONTENT="noindex,nofollow">